\documentclass[a4paper,12pt]{article}
\usepackage[portuguese]{babel}
\usepackage[utf8]{inputenc}
\usepackage{setspace}

\paperheight = 297mm
\paperwidth = 210mm
\footskip = 20mm
\textheight = 240mm
\textwidth = 150mm
\topmargin = 7mm
\oddsidemargin = 10mm

\begin{document}

\input{./titulo.tex}

\section{Tema}

Recuperação de informação no contexto web. 

\section{Resumo}

Organizar e recuperar informação sempre foi algo presente na história humana.
Desde a antiguidade, foram sendo criados métodos para agrupar as informações
existentes como pergaminhos e chegando aos livros e enciclopédias. Como
consequência, isso gerou jeitos de catalogar e recuperar essas informações
quando fosse necessário, um bom exemplo são os sistemas de busca tradicionais em
bibliotecas.

A busca tradicional teve um grande salto com o surgimento dos primeiros
computadores digitais, em meados da d&eacutecada de 1940, que permitiram buscas mais 
rápidas, além de recuperar informa&ccedil&otildees sobre os documentos relevantes à busca.

Porém a maior revolução ocorreu em 1989, com o surgimento da
\textit{World Wide Web} (WWW), na qual pela primeira vez foram criadas coleções
de documentos que possuiam apontadores (\textit{hyperlinks}) para outros 
documentos. A WWW se tornou rapidamente o principal repositório de informações,
crescendo em uma velocidade jamais vista.

Com este crescimento da WWW, um antigo problema tomou novas proporções. Como 
recuperar informações relevantes em um ambiente novo e muito diferente? Os novos
desafios deste ambiente incluem:

\begin{itemize}

\item Tamanho:
A WWW é grande, muito grande, a ponto de ser atualmente a maior coleção de
informação existente.

\item Dinamismo:
A WWW é dinâmica, isto é, os documentos nela mudam! Mudam de conteúdo, de lugar,
os \textit{hyperlinks} são alterados, novos documentos são adicionados.

\item Auto-organização:
Na WWW, não há um controle sobre o conteúdo de documentos. Documentos aparecem
e desaparecem, o conteúdo deles é muitas vezes incerto e cada um deles pode
apontar para qualquer outro documento.

\item \textit{Hyperlinks}:
Porém, a WWW possui \textit{hyperlinks}. Eles fazem ser possível ``navegar'' na 
WWW e com isso, teremos a base para encontrar documentos relevantes.

\end{itemize}

Os primeiros mecanismos de busca concentravam-se no conteúdo para encontrar os
documentos, porém nem sempre estes documentos eram relevantes, embora tivessem
um conteúdo próximo ao desejado.

Usando a estrutura de \textit{hyperlinks}, um novo modelo para encontrar
informações relevantes foi pensado, um deles sendo o \textit{PageRank}, que
calcula a relevância de um documento, baseado na estrutura de \textit{links} da
WWW. Estes métodos são chamados de "classificadores por popularidade".


\section{Objetivos}

Neste projeto pretendemos, inicialmente, estudar a teoria sobre mecanismos de
busca, em especial sobre os métodos de classificação por popularidade, sendo um
deles o \textit{PageRank}.

Após ter a base formada, a foco central será implementar um mecanismo de busca
sobre domínios restritos que utilize algum método de classificação por
popularidade, exibindo esta classificação.


\section{Atividades realizadas}

As atividades realizadas até agora foram:

\begin{itemize}

\item Reuniões semanais com o supervisor.
\item Estudo de materiais sobre o assunto.
\item Implementações básicas (Web Crawler, PageRank).

\end{itemize}


\section{Cronograma}

\begin{center}

\begin{tabular}{ | l | c | c | c | c | c | c | c | c | c |}            \hline
              & mar & abr & mai & jun & jul & ago & set & out & nov \\ \hline
Estudos       &  x  &  x  &  x  &  x  &  x  &  x  &     &     &     \\ \hline
Implementação &     &     &     &     &  x  &  x  &  x  &  x  &     \\ \hline
Monografia    &     &     &     &     &     &  x  &  x  &  x  &  x  \\ \hline
Apresentação  &     &     &     &     &     &     &     &     &  x  \\ \hline
Pôster        &     &     &     &     &     &     &     &     &  x  \\ \hline
\end{tabular}

\end{center}


\section{Estrutura esperada da monografia}

Atualmente, uma estrutra que é viável para a monografia é:

\begin{enumerate}

\item Introdução

\item Grafo da Web

\item Mecanismo de busca

\item PageRank

\item Implementações e simulações

\item Desafios e dificuldades

\item Parte Subjetiva

\end{enumerate}

Esta estrutura poderá ser modificada a medida que o trabalho for avançando
durante o ano.

\section{Bibliografia}

\bibliographystyle{joseplain}
\bibliography{refs}

\nocite{*}

\end{document}

